iT邦幫忙

2021 iThome 鐵人賽

DAY 1
5
AI & Data

AI Voice Conversion系列 第 1

【Day1】準備出發

  • 分享至 

  • xImage
  •  

前言與動機

在提到聲音轉換的時候,我們第一個會想到的可能就像是柯南那樣 (他會把他叔叔麻醉然後用變聲器偽裝成他的聲音),而事實上我們想做的就是同樣的事情 (沒有麻醉的部分)

然而轉換聲音這件事情並不是一件很有創意的事,早在 5 年前的時候就有人成功了,甚至在 2018 年的時候有家叫 琴鳥 (Lyrebird) 的公司發表了一部影片,內容是複製了川普的聲音

公司的名字會叫做琴鳥的原因是因為這種鳥在自然界會模仿周遭所聽到的聲音,而且你不覺得叫琴鳥比叫八哥或鸚鵡好聽嗎?

Yes

你可以想像未來就算接到視訊電話,你也不見得能夠確定電話另一頭就是真正你認識的那個人,AI 的換臉技術加上聲音轉換技術如果都能夠到達 Real - Time 又高品質的水準的話,而這樣的未來似乎離我們不遠。

換句話說,也就是現在的水平或許還沒辦法那麼厲害,或是可能有一些限制,像是訓練困難等等

接下來的時間大致上會這樣安排做分享,還請大家多多指教!

大綱

  • DAY 1 ~ 4 - 聲音的基本介紹與前處理,GAN
  • DAY 4 ~ 12 - Vocoder,AUTO-VC Inference In Pytorch
  • DAY 12 ~ 21 - MODEL 介紹與實作 In TensorFlow,也許中間會加入一小部分生成音樂的介紹
  • DAY 21 ~ 30 - TransFormer 的實作分享

備註

一些程式碼會一併更新在 我的 GITHUB

/images/emoticon/emoticon09.gif/images/emoticon/emoticon13.gif/images/emoticon/emoticon14.gif/images/emoticon/emoticon22.gif/images/emoticon/emoticon28.gif


下一篇
【Day2】聲音的一些基本介紹
系列文
AI Voice Conversion30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言